日本精品在线免费观看,丝袜美腿一区二区三区三

當(dāng)前位置：北京新鴻儒網(wǎng)站建設(shè)公司>幫助中心>用戶(hù)幫助>網(wǎng)站建設(shè)>正文

網(wǎng)頁(yè)結(jié)構(gòu)化的過(guò)程即有價(jià)值信息被保留的過(guò)程

發(fā)布時(shí)間：2013-12-07 瀏覽：316打印字號(hào)：大 中 小

向大家介紹過(guò)網(wǎng)頁(yè)結(jié)構(gòu)化的目標(biāo)，結(jié)構(gòu)化的過(guò)程就是網(wǎng)站有價(jià)值信息被保留的過(guò)程，今天之所以又用這樣的標(biāo)題來(lái)寫(xiě)一篇文章，其實(shí)是有目的的，是想再次的提醒網(wǎng)站seo優(yōu)化人員，搜索引擎工作原理是做好網(wǎng)站優(yōu)化工作的基礎(chǔ)。
　　現(xiàn)在不比前幾年，一說(shuō)網(wǎng)站優(yōu)化一說(shuō)SEO優(yōu)化，改改title，discription，keyword，發(fā)發(fā)外鏈，網(wǎng)頁(yè)的排名效果就會(huì)有。但現(xiàn)在僅僅指望這點(diǎn)已經(jīng)不起作用了，人人都會(huì)的東西，你再拿出來(lái)作為自己的優(yōu)勢(shì)，實(shí)際上是落伍了，再加上黑帽seo優(yōu)化的猖獗，針對(duì)百度的優(yōu)化，針對(duì)google的優(yōu)化層出不窮，搜索引擎也在不斷的調(diào)整著算法。要做SEO優(yōu)化的前鋒戰(zhàn)士，根據(jù)互聯(lián)網(wǎng)的發(fā)展變化，時(shí)時(shí)保持清醒的頭腦，吸收新的知識(shí)，只有這樣網(wǎng)站的優(yōu)化效果才可能在你的控制之中。
　　話(huà)回正題，來(lái)簡(jiǎn)單解釋一下，網(wǎng)頁(yè)結(jié)構(gòu)化的過(guò)程即有價(jià)值信息被保留的過(guò)程。明白了網(wǎng)頁(yè)結(jié)構(gòu)化的目標(biāo)后，就應(yīng)該明白，體現(xiàn)網(wǎng)頁(yè)本身價(jià)值和內(nèi)容的5個(gè)屬性被抽取出來(lái)，即，標(biāo)題(title)、錨文本(anchor text)、正文標(biāo)題(content title)、正文(content)和正向鏈接(link)。對(duì)搜索引擎來(lái)說(shuō)，這5個(gè)屬性就是有價(jià)值的信息(當(dāng)然，也是對(duì)用戶(hù)有價(jià)值的內(nèi)容)。
　　我們來(lái)具體看一下網(wǎng)頁(yè)結(jié)構(gòu)化是如何進(jìn)行的?
　　網(wǎng)頁(yè)結(jié)構(gòu)化的過(guò)程首先通過(guò)標(biāo)簽樹(shù)進(jìn)行分析得到文本對(duì)應(yīng)的標(biāo)簽，然后通過(guò)投票算法確定正文及配圖等僅從HTML標(biāo)簽無(wú)法判斷的網(wǎng)頁(yè)數(shù)據(jù)。以下是專(zhuān)業(yè)人士總結(jié)的兩步走：
　　HTML標(biāo)簽樹(shù)
　　一、建立html標(biāo)簽樹(shù)(tag-tree)。
　　萬(wàn)維網(wǎng)上大多數(shù)的靜態(tài)網(wǎng)頁(yè)都以HTML網(wǎng)頁(yè)形式存在，HTML是一種標(biāo)識(shí)語(yǔ)言(Markup Language)，它把其描述的全部?jī)?nèi)容都按照HTML語(yǔ)法存放在標(biāo)簽之中。為了更清楚地描述網(wǎng)頁(yè)內(nèi)容的組織結(jié)構(gòu)，將網(wǎng)頁(yè)中的標(biāo)簽按照出現(xiàn)順序依次整理出來(lái)并用適當(dāng)?shù)慕Y(jié)構(gòu)記錄。由于標(biāo)簽之間的嵌套關(guān)系，因此整理結(jié)果自然是一個(gè)樹(shù)狀結(jié)構(gòu)，我們把整理一個(gè)網(wǎng)頁(yè)中的標(biāo)簽得到的樹(shù)狀結(jié)構(gòu)稱(chēng)為該網(wǎng)頁(yè)的“標(biāo)簽樹(shù)”。
　　很顯然，查看該網(wǎng)頁(yè)的用戶(hù)看到的是相當(dāng)友好的信息。而實(shí)際源文件中的那些HTML標(biāo)記，如和(可以理解為用來(lái)幫助IE瀏覽器理解網(wǎng)頁(yè))等都不會(huì)實(shí)際地展示給用戶(hù)。因此搜索引擎的分析系統(tǒng)需要學(xué)習(xí)IE瀏覽器理解網(wǎng)頁(yè)的方式來(lái)理解網(wǎng)頁(yè)，在理解過(guò)程中需要建立一個(gè)HTML標(biāo)簽樹(shù)的樹(shù)形結(jié)構(gòu)。通過(guò)建立標(biāo)簽樹(shù)，并且識(shí)別標(biāo)簽所描述的文字，網(wǎng)頁(yè)結(jié)構(gòu)化進(jìn)程就走出了重要的一步，能夠順利提取出了網(wǎng)頁(yè)的標(biāo)題。但實(shí)際的網(wǎng)頁(yè)，同一個(gè)標(biāo)簽所描述的文字內(nèi)容不是唯一確定的，比如廣告內(nèi)容也可能放在標(biāo)簽里，而這不是真正的正文，是會(huì)影響用戶(hù)的搜索體驗(yàn)，所以就有了下面投票法得正文。
　　二、通過(guò)投票方法識(shí)別正文的文本塊，并按照深度優(yōu)先遍歷的規(guī)則組織為正文。
　　判斷哪個(gè)文本塊是正文采用稱(chēng)為“投票算法”的計(jì)算方法，這種方法在搜索引擎別常用。在日常生活中幾乎所有人都會(huì)有投票或選舉的經(jīng)歷，如選舉干部和通過(guò)決議需要投票，以及運(yùn)動(dòng)員的一套動(dòng)作需要裁判員打分等。其基本原理在于認(rèn)為大多數(shù)人的意見(jiàn)往往是正確的。大多數(shù)人的統(tǒng)一主觀意見(jiàn)就會(huì)變得較為客觀。雖然每個(gè)人的給出的分?jǐn)?shù)是主觀產(chǎn)生的，但是這種評(píng)判的方法和結(jié)果被認(rèn)為是相對(duì)客觀和可信的。正文抽取的投票算法的過(guò)程如何呢?首先搜索引擎會(huì)定義一系列的規(guī)則，然后通過(guò)這些規(guī)則為每個(gè)文本塊打分。得分最高的被認(rèn)為是正文的可能性足夠大，并且可以接受。搜索引擎定的規(guī)則，也是需要通過(guò)足夠多的網(wǎng)頁(yè)進(jìn)行反饋，之后才能得到一個(gè)公正客觀的打分。由于HTML標(biāo)簽的相互嵌套的特性，決定了深度優(yōu)先遍歷的順序恰好能夠組織成一個(gè)完整的正文。

上一篇：人才網(wǎng)站如何盈利下一篇：如何讓您的網(wǎng)站與眾不同:一看便知 [關(guān)閉窗口]

海外亚洲黄色视频_97久久国产综合_熟女乱中文字幕熟女熟妇_日韩中文字幕v亚洲中文字幕_国产成人久久91网站下载_精品国产超燃电影在线观看

我們的服務(wù)遍布中國(guó)
乃至世界

網(wǎng)頁(yè)結(jié)構(gòu)化的過(guò)程即有價(jià)值信息被保留的過(guò)程

發(fā)布時(shí)間：2013-12-07 瀏覽：316打印字號(hào)：大 中 小

猜你喜歡

現(xiàn)在就與新鴻儒客服交流

海外亚洲黄色视频_97久久国产综合_熟女乱中文字幕熟女熟妇_日韩中文字幕v亚洲中文字幕_国产成人久久91网站下载_精品国产超燃电影在线观看

網(wǎng)頁(yè)結(jié)構(gòu)化的過(guò)程 即有價(jià)值信息被保留的過(guò)程

發(fā)布時(shí)間：2013-12-07 瀏覽：316打印字號(hào)：大中小

猜你喜歡

現(xiàn)在就與新鴻儒客服交流

網(wǎng)頁(yè)結(jié)構(gòu)化的過(guò)程即有價(jià)值信息被保留的過(guò)程